Dades massives

Creixement i digitalització de la capacitat global d'emmagatzematge d'informació[1]

Dades massives[2] (o Big Data[3][4][5][6]) és el nom que reben els conjunts de dades, els procediments i les aplicacions informàtiques, que, pel seu volum, la seva naturalesa diversa i la velocitat a què han de ser processades, ultrapassen la capacitat dels sistemes informàtics habituals. Aquest processament de dades massives s'utilitza per detectar-hi patrons, podent fer així prediccions vàlides per a la presa de decisions.[7]

La disciplina dedicada a les dades massives s'emmarca dins de les tecnologies de la informació i la comunicació. Aquesta disciplina s'ocupa de totes les activitats relacionades amb els sistemes que gestionen grans conjunts de dades. Les dificultats més habituals en aquests casos se centren en la captura, l'emmagatzematge,[8] la cerca, la compartició, l'anàlisi,[9] i la seva visualització.[10] La tendència de manipular ingents quantitats de dades es deu a la necessitat, en molts casos, d'incloure aquesta informació per a la creació d'informes estadístics i models predictius emprats en diversos camps,[11] com per exemple de les anàlisis de negoci, publicitat, les dades de malalties infeccioses, l'espionatge i el seguiment de la població o la lluita contra el crim organitzat.

El límit superior de la capacitat de processament s'ha anat desplaçant al llarg dels anys. D'aquesta forma els límits que estaven fixats el 2008 rondaven l'ordre de petabytes a zettabytes de dades.[12] Els científics amb certa regularitat troben limitacions a causa de la gran quantitat de dades a analitzar en certes àrees, com ara la meteorologia, la genòmica,[13] les complexes simulacions de processos físics,[14] i les investigacions relacionades amb els processos biològics i ambientals.[15] Les limitacions també afecten els motors de cerca a internet, als sistemes financers i a la informàtica de negocis.

El volum del conjunt de dades creix degut, en part, a la introducció d'informació ubiqua procedent dels sensors sense fils i els dispositius mòbils (per exemple les VANETs[16]), del constant creixement dels històrics d'interaccions d'aplicacions (per exemple processos de registre), càmeres digitals (sistemes de teledetecció), micròfons, lectors de ràdio -identificador de freqüència.[17][18] La capacitat tecnològica per capita a nivell mundial d'emmagatzemar dades es multiplica aproximadament per dos cada quaranta mesos des dels anys vuitanta.[19] S'estima que durant el 2012, cada dia es van crear a prop de 2,5 trilions de bytes de dades (de l'anglès quintillion, 2.5 × 1018).[20]

  1. «The World's Technological Capacity to Store, Communicate, and Compute Information». MartinHilbert.net. [Consulta: 13 abril 2016].
  2. «TERMCAT - Cercaterm - dades massives» (en castellà). [Consulta: 30 abril 2017].
  3. White, Tom. Hadoop: The Definitive Guide. 2009. 1st Edition. O'Reilly Media. Pg 3.
  4. «Big data». [Consulta: 22 desembre 2023].
  5. White, Tom. Hadoop: The Definitive Guide. 1a ed.. O'Reilly Media, 2009, p. Pg 3. 
  6. «big data - Cercaterm | TERMCAT». [Consulta: 13 octubre 2022].
  7. Pawan i Rao, 2015, p. 418.
  8. ↑ Kusnetzky, Dan. What is "Big Data?". ZDNet. http://blogs.zdnet.com/virtualization/?p=1708 Arxivat 2010-02-21 a Wayback Machine.
  9. Vance, Ashlee. «Start-Up Goes After Big Data With Hadoop Helper» (en anglès), 22-04-2010. [Consulta: 22 desembre 2023].
  10. Keim, Qu i Ma, 2013, p. 20.
  11. Pawan i Rao, 2015, p. 415, 419.
  12. Horowitz, Mark «Visualizing Big Data: Bar Charts for Words» (en anglès). Wired. ISSN: 1059-1028.
  13. Community cleverness required. Nature, 455(7209), 1. 2008. http://www.nature.com/nature/journal/v455/n7209/full/455001a.html
  14. Sandia sees data management challenges spiral. HPC Projects. 4 August 2009. http://www.hpcprojects.com/news/news_story.php?news_id=922 Arxivat 2016-04-03 a Wayback Machine.
  15. Reichman,O.J., Jones, M.B., and Schildhauer, M.P. 2011. Challenges and Opportunities of Open Data in Ecology. Science 331(6018): 703-705.DOI:10.1126/science.1197962
  16. Zeadally, Sherali; Hunt, Ray; Chen, Yuh-Shyan; Irwin, Angela; Hassan, Aamir «Vehicular ad hoc networks (VANETS): status, results, and challenges» (en anglès). Telecommunication Systems. Springer, 50, núm. 4, agost 2012, pàg. 217-241.
  17. Hellerstein, Joe. Parallel Programming in the Age of Big Data. Gigaom Blog. 9 November 2008. http://gigaom.com/2008/11/09/mapreduce-leads-the-way-for-parallel-programming/ Arxivat 2012-10-07 a Wayback Machine.
  18. Segaran, Toby and Hammerbacher, Jeff. Beautiful Data. 1st Edition. O'Reilly Media. Pg 257.
  19. "The World's Technological Capacity to Store, Communicate, and Compute Information", Martin Hilbert and Priscila López (2011), Science (journal), 332(6025), 60-65; free access to the article through here: martinhilbert.net/WorldInfoCapacity.htm
  20. «IBM Products» (en anglès americà), 09-11-2020. [Consulta: 22 desembre 2023].

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne